近日,有关 Google 搜寻演算法、网站排名机制的「流量机密」被 Google 自己上传到 Github 上,这些共 2500 份的秘密文件就这样被摊在阳光下,引发讨论,Google 近日证实这些机密都是真实的,但拒绝对此发表评论。
这些档案详细描述了 Google 可以追踪的资料,其中一些资料可能被用于其严密保护的搜寻排名演算法。虽然细节仍然不全,但这些档案仍为我们提供了一个机会一窥这个对网路影响最大的系统的秘密。
Google 发言人 Davis Thompson 在一封回覆媒体的邮件中证实文件内容全是真实的,并且提醒外界勿根据这些不完整的资讯,对 Google 搜寻排名做出臆测,「我们已公开详细资料,解释搜寻系统的运作模式以及所考量的各项因素指标,同时也在积极防范演算法遭受人为操弄。」
首先披露这批内部文件的是几位知名搜寻引擎优化(SEO)专家,包含 Rand Fishkin 和 Mike King,他们在本周稍早便已分析这批文件内容并展开初步评论。从这批泄漏文件可得知,Google 收集并可能使用过去所说的「无助于 Google 搜寻网页排名的资料」,如点击量、Chrome 浏览器使用者资料等,同时将这类数据纳入演算法运作考量。
但目前还未透露相关因子在演算法中的权重比重,以及哪些资料实际上真正被用于搜寻内容的排名。尽管如此,这份文件预计仍然会掀起一阵风暴,因为 Google 向来对其核心搜寻演算法的运作机制严加保密,而其标准也关乎所有网路业者的利益。